Crear código en R, uso colaborativo y reproducible
R es un lenguaje y entorno de programación especializado en:
Análisis estadístico, visualización de datos y ciencia de datos.
Utilizado por investigadores, analistas y científicos para explorar, modelar y comunicar información basada en datos de forma eficiente y reproducible.
Mejorar la comprensión y la práctica estadística.
Desarrollar habilidades en programación en R.
Aprender flujos de trabajo eficientes, limpios y reproducibles.
Saber buscar información
No enredarse en errores
A programar en plan pro sin mirar internet o chatgpt
A hacer páginas web
A dejar de pelearte con la estadística
R → Es el lenguaje de programación y el motor que realiza los cálculos estadísticos y el análisis de datos.
RStudio → Es un entorno de desarrollo integrado (un programa) que facilita el uso de R con una interfaz amigable, paneles, autocompletado y herramientas visuales.
R es una calculadora
Puede leer tablas, generarlas, guardarlas
Hacer estadística compleja (y sobre todo basada en biología)
Crear páginas webs, gráficos interactivos, presentaciones,
Crear nuevos paquetes de R
Hacer funciones
Es una calculadora
La magia de los objetos
Los objetos empiezan por una letra
Son sensibles a mayusculas
Tienen que llevar nombres coherentes y un orden
Hay muuchos tipos de objetos - numéricos - caracteres - matrices, tablas - listas - modelos - polígonos - funciones
[1] 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
[26] 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40
[1] 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35
[26] 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50
[1] 3
[1] 3 6 9 12 15
[1] 1.00000000 1.00000000 1.00000000 1.00000000 1.00000000 0.16666667
[7] 0.28571429 0.37500000 0.44444444 0.50000000 0.09090909 0.16666667
[13] 0.23076923 0.28571429 0.33333333 0.06250000 0.11764706 0.16666667
[19] 0.21052632 0.25000000 0.04761905 0.09090909 0.13043478 0.16666667
[25] 0.20000000 0.03846154 0.07407407 0.10714286 0.13793103 0.16666667
[31] 0.03225806 0.06250000 0.09090909 0.11764706 0.14285714 0.02777778
[37] 0.05405405 0.07894737 0.10256410 0.12500000
[1] 1 2 3 4 5 6 7 8 9 10
[1] 0.1231105 0.5209919 0.7822661 0.1913035 0.1018627
[1] 99.94671 88.45470 86.99718
[1] 1.1167599 -0.4799958 1.8701499 -0.7472303
# Especificando la media y la desviación
x <- rnorm(400, mean=50, sd=10)
# Sample = elegir 3 bolas de un bingo en el que hay 100
sample(0:100, 3, replace=TRUE) [1] 20 1 61
[1] 0 10 20 30 40 50 60 70 80 90 100
Las funciones son aplicaciones que nos permiten realizar operaciones muy diversas.
# Queremos la media de nuestros números transformados a logaritmo
vector <- seq(1, 100, 10)
mean (log (vector))[1] 3.380067
[1] 1.355705
[1] 4.065497
[1] 2.069674
log_vect <- function (y) {
mean_y <- mean (log (y+1))
sd_y <- sd (log (y+1))
print(paste("La media es", mean_y, ", la desviación estándar es:", round(sd_y,2)))
return(log(y))
}
vector3 <- seq(1, 300, 4)
distribution = log_vect (vector3)[1] "La media es 4.70839604852934 , la desviación estándar es: 0.98"
Los “pipes” permiten escribir código paso a paso, de forma legible:
# 1. Calcula el minimo valor de 100 valores aleatorios según una distribución normal
min (rnorm (100))[1] -1.90432
# 2. Dada una secuencia de 20 números seguidos (del 0 al 20), genera los pares y guárdalo en un objeto.
pares <- seq (0, 20, 2)
# 3. Ejercicio:
# Crea un vector con 20 números aleatorios entre 0 y 50.
# Calcula el promedio y la desviación estándar.
# Multiplica todos los valores por 2.
# Dibuja un histograma.
#¿Cómo cambia el promedio después de multiplicar por 2?
mi_vector <- runif(20,0,50)
mean (mi_vector)[1] 20.71439
[1] 15.19073